home *** CD-ROM | disk | FTP | other *** search
/ Celestin Apprentice 5 / Apprentice-Release5.iso / Source Code / C / Applications / MacGzip 1.0 / source / GNU / unlzw.c < prev    next >
Text File  |  1995-09-27  |  9KB  |  402 lines

  1. /* unlzw.c -- decompress files in LZW format.
  2.  * The code in this file is directly derived from the public domain 'compress'
  3.  * written by Spencer Thomas, Joe Orost, James Woods, Jim McKie, Steve Davies,
  4.  * Ken Turkowski, Dave Mack and Peter Jannesen.
  5.  *
  6.  * This is a temporary version which will be rewritten in some future version
  7.  * to accommodate in-memory decompression.
  8.  */
  9.  
  10. /*
  11.  * Changed: Sept 27, 1995. spd for MacGzip 1.0
  12.  *     - changed some stderr messages
  13.  *     - don't include sys/types.h
  14.  * 
  15.  */
  16.  
  17. #ifdef RCSID
  18. static char rcsid[] = "$Id: unlzw.c,v 0.15 1993/06/10 13:28:35 jloup Exp $";
  19. #endif
  20.  
  21. #include "tailor.h"
  22.  
  23. #ifndef MACGZIP /* spd */ /* tailor.h was after this next line */
  24. #  include <sys/types.h>
  25. #else
  26. #  include "MacIO.h"
  27. #  include "FileTypes.h"
  28. #  include "Globals.h"
  29. #endif
  30.  
  31. #ifdef HAVE_UNISTD_H
  32. #  include <unistd.h>
  33. #endif
  34. #ifndef NO_FCNTL_H
  35. #  include <fcntl.h>
  36. #endif
  37.  
  38. #include "gzip.h"
  39. #include "lzw.h"
  40.  
  41. typedef    unsigned char    char_type;
  42. typedef          long   code_int;
  43. typedef unsigned long     count_int;
  44. typedef unsigned short    count_short;
  45. typedef unsigned long     cmp_code_int;
  46.  
  47. #define MAXCODE(n)    (1L << (n))
  48.     
  49. #ifndef    REGISTERS
  50. #    define    REGISTERS    2
  51. #endif
  52. #define    REG1    
  53. #define    REG2    
  54. #define    REG3    
  55. #define    REG4    
  56. #define    REG5    
  57. #define    REG6    
  58. #define    REG7    
  59. #define    REG8    
  60. #define    REG9    
  61. #define    REG10
  62. #define    REG11    
  63. #define    REG12    
  64. #define    REG13
  65. #define    REG14
  66. #define    REG15
  67. #define    REG16
  68. #if REGISTERS >= 1
  69. #    undef    REG1
  70. #    define    REG1    register
  71. #endif
  72. #if REGISTERS >= 2
  73. #    undef    REG2
  74. #    define    REG2    register
  75. #endif
  76. #if REGISTERS >= 3
  77. #    undef    REG3
  78. #    define    REG3    register
  79. #endif
  80. #if REGISTERS >= 4
  81. #    undef    REG4
  82. #    define    REG4    register
  83. #endif
  84. #if REGISTERS >= 5
  85. #    undef    REG5
  86. #    define    REG5    register
  87. #endif
  88. #if REGISTERS >= 6
  89. #    undef    REG6
  90. #    define    REG6    register
  91. #endif
  92. #if REGISTERS >= 7
  93. #    undef    REG7
  94. #    define    REG7    register
  95. #endif
  96. #if REGISTERS >= 8
  97. #    undef    REG8
  98. #    define    REG8    register
  99. #endif
  100. #if REGISTERS >= 9
  101. #    undef    REG9
  102. #    define    REG9    register
  103. #endif
  104. #if REGISTERS >= 10
  105. #    undef    REG10
  106. #    define    REG10    register
  107. #endif
  108. #if REGISTERS >= 11
  109. #    undef    REG11
  110. #    define    REG11    register
  111. #endif
  112. #if REGISTERS >= 12
  113. #    undef    REG12
  114. #    define    REG12    register
  115. #endif
  116. #if REGISTERS >= 13
  117. #    undef    REG13
  118. #    define    REG13    register
  119. #endif
  120. #if REGISTERS >= 14
  121. #    undef    REG14
  122. #    define    REG14    register
  123. #endif
  124. #if REGISTERS >= 15
  125. #    undef    REG15
  126. #    define    REG15    register
  127. #endif
  128. #if REGISTERS >= 16
  129. #    undef    REG16
  130. #    define    REG16    register
  131. #endif
  132.     
  133. #ifndef    BYTEORDER
  134. #    define    BYTEORDER    0000
  135. #endif
  136.     
  137. #ifndef    NOALLIGN
  138. #    define    NOALLIGN    0
  139. #endif
  140.  
  141.  
  142. union    bytes {
  143.     long  word;
  144.     struct {
  145. #if BYTEORDER == 4321
  146.     char_type    b1;
  147.     char_type    b2;
  148.     char_type    b3;
  149.     char_type    b4;
  150. #else
  151. #if BYTEORDER == 1234
  152.     char_type    b4;
  153.     char_type    b3;
  154.     char_type    b2;
  155.     char_type    b1;
  156. #else
  157. #    undef    BYTEORDER
  158.     int  dummy;
  159. #endif
  160. #endif
  161.     } bytes;
  162. };
  163.  
  164. #if BYTEORDER == 4321 && NOALLIGN == 1
  165. #  define input(b,o,c,n,m){ \
  166.      (c) = (*(long *)(&(b)[(o)>>3])>>((o)&0x7))&(m); \
  167.      (o) += (n); \
  168.    }
  169. #else
  170. #  define input(b,o,c,n,m){ \
  171.      REG1 char_type *p = &(b)[(o)>>3]; \
  172.      (c) = ((((long)(p[0]))|((long)(p[1])<<8)| \
  173.      ((long)(p[2])<<16))>>((o)&0x7))&(m); \
  174.      (o) += (n); \
  175.    }
  176. #endif
  177.  
  178. #ifndef MAXSEG_64K
  179.    /* DECLARE(ush, tab_prefix, (1<<BITS)); -- prefix code */
  180. #  define tab_prefixof(i) tab_prefix[i]
  181. #  define clear_tab_prefixof()    memzero(tab_prefix, 256);
  182. #else
  183.    /* DECLARE(ush, tab_prefix0, (1<<(BITS-1)); -- prefix for even codes */
  184.    /* DECLARE(ush, tab_prefix1, (1<<(BITS-1)); -- prefix for odd  codes */
  185.    ush *tab_prefix[2];
  186. #  define tab_prefixof(i) tab_prefix[(i)&1][(i)>>1]
  187. #  define clear_tab_prefixof()    \
  188.       memzero(tab_prefix0, 128), \
  189.       memzero(tab_prefix1, 128);
  190. #endif
  191. #define de_stack        ((char_type *)(&d_buf[DIST_BUFSIZE-1]))
  192. #define tab_suffixof(i) tab_suffix[i]
  193.  
  194. int block_mode = BLOCK_MODE; /* block compress mode -C compatible with 2.0 */
  195.  
  196. /* ============================================================================
  197.  * Decompress in to out.  This routine adapts to the codes in the
  198.  * file building the "string" table on-the-fly; requiring no table to
  199.  * be stored in the compressed file.
  200.  * IN assertions: the buffer inbuf contains already the beginning of
  201.  *   the compressed data, from offsets iptr to insize-1 included.
  202.  *   The magic header has already been checked and skipped.
  203.  *   bytes_in and bytes_out have been initialized.
  204.  */
  205. int unlzw(in, out) 
  206.     int in, out;    /* input and output file descriptors */
  207. {
  208.     REG2   char_type  *stackp;
  209.     REG3   code_int   code;
  210.     REG4   int        finchar;
  211.     REG5   code_int   oldcode;
  212.     REG6   code_int   incode;
  213.     REG7   long       inbits;
  214.     REG8   long       posbits;
  215.     REG9   int        outpos;
  216. /*  REG10  int        insize; (global) */
  217.     REG11  unsigned   bitmask;
  218.     REG12  code_int   free_ent;
  219.     REG13  code_int   maxcode;
  220.     REG14  code_int   maxmaxcode;
  221.     REG15  int        n_bits;
  222.     REG16  int        rsize;
  223.     
  224. #ifdef MAXSEG_64K
  225.     tab_prefix[0] = tab_prefix0;
  226.     tab_prefix[1] = tab_prefix1;
  227. #endif
  228.     maxbits = get_byte();
  229.     block_mode = maxbits & BLOCK_MODE;
  230.     if ((maxbits & LZW_RESERVED) != 0) {
  231.     WARN((stderr, "\n%s: %s: warning, unknown flags 0x%x\n",
  232.           progname, ifname, maxbits & LZW_RESERVED));
  233.     }
  234.     maxbits &= BIT_MASK;
  235.     maxmaxcode = MAXCODE(maxbits);
  236.     
  237.     if (maxbits > BITS) {
  238. #ifndef _MAC_ERRORS_H_ /* spd */
  239.     fprintf(stderr,
  240.         "\n%s: %s: compressed with %d bits, can only handle %d bits\n",
  241.         progname, ifname, maxbits, BITS);
  242. #else
  243.     DoError(NO_ERR, WARN_ERR,"%s: %s: compressed with %d bits, can only handle %d bits",
  244.         progname, ifname, maxbits, BITS);
  245. #endif
  246.  
  247.     exit_code = ERROR;
  248.     return ERROR;
  249.     }
  250.  
  251.     rsize = insize;
  252.  
  253.     maxcode = MAXCODE(n_bits = INIT_BITS)-1;
  254.     bitmask = (1<<n_bits)-1;
  255.     oldcode = -1;
  256.     finchar = 0;
  257.     outpos = 0;
  258.     posbits = inptr<<3;
  259.  
  260.     free_ent = ((block_mode) ? FIRST : 256);
  261.     
  262.     clear_tab_prefixof(); /* Initialize the first 256 entries in the table. */
  263.     
  264.     for (code = 255 ; code >= 0 ; --code) {
  265.     tab_suffixof(code) = (char_type)code;
  266.     }
  267.     do {
  268.     REG1 int i;
  269.     int  e;
  270.     int  o;
  271.     
  272.     resetbuf:
  273.     e = insize-(o = (posbits>>3));
  274.     
  275.     for (i = 0 ; i < e ; ++i) {
  276.         inbuf[i] = inbuf[i+o];
  277.     }
  278.     insize = e;
  279.     posbits = 0;
  280.     
  281. #ifdef MACGZIP
  282.     DoSystemTask();
  283. #endif
  284.     if (insize < INBUF_EXTRA) {
  285.         if ((rsize = read(in, (char*)inbuf+insize, INBUFSIZ)) == EOF) {
  286.         read_error();
  287.         }
  288.         insize += rsize;
  289.         bytes_in += (ulg)rsize;
  290.     }
  291.     inbits = ((rsize != 0) ? ((long)insize - insize%n_bits)<<3 : 
  292.           ((long)insize<<3)-(n_bits-1));
  293.     
  294.     while (inbits > posbits) {
  295.         if (free_ent > maxcode) {
  296.         posbits = ((posbits-1) +
  297.                ((n_bits<<3)-(posbits-1+(n_bits<<3))%(n_bits<<3)));
  298.         ++n_bits;
  299.         if (n_bits == maxbits) {
  300.             maxcode = maxmaxcode;
  301.         } else {
  302.             maxcode = MAXCODE(n_bits)-1;
  303.         }
  304.         bitmask = (1<<n_bits)-1;
  305.         goto resetbuf;
  306.         }
  307.         input(inbuf,posbits,code,n_bits,bitmask);
  308.         Tracev((stderr, "%d ", code));
  309.  
  310.         if (oldcode == -1) {
  311.         if (code >= 256) error("corrupt input.");
  312.         outbuf[outpos++] = (char_type)(finchar = (int)(oldcode=code));
  313.         continue;
  314.         }
  315.         if (code == CLEAR && block_mode) {
  316.         clear_tab_prefixof();
  317.         free_ent = FIRST - 1;
  318.         posbits = ((posbits-1) +
  319.                ((n_bits<<3)-(posbits-1+(n_bits<<3))%(n_bits<<3)));
  320.         maxcode = MAXCODE(n_bits = INIT_BITS)-1;
  321.         bitmask = (1<<n_bits)-1;
  322.         goto resetbuf;
  323.         }
  324.         incode = code;
  325.         stackp = de_stack;
  326.         
  327.         if (code >= free_ent) { /* Special case for KwKwK string. */
  328.         if (code > free_ent) {
  329. #ifdef DEBUG            
  330.             char_type *p;
  331.  
  332.             posbits -= n_bits;
  333.             p = &inbuf[posbits>>3];
  334.             fprintf(stderr,
  335.                 "code:%ld free_ent:%ld n_bits:%d insize:%u\n",
  336.                 code, free_ent, n_bits, insize);
  337.             fprintf(stderr,
  338.                 "posbits:%ld inbuf:%02X %02X %02X %02X %02X\n",
  339.                 posbits, p[-1],p[0],p[1],p[2],p[3]);
  340. #endif
  341.             if (!test && outpos > 0) {
  342.             write_buf(out, (char*)outbuf, outpos);
  343.             bytes_out += (ulg)outpos;
  344.             }
  345.             error(to_stdout ? "corrupt input." :
  346.               "corrupt input. Use zcat to recover some data.");
  347.         }
  348.         *--stackp = (char_type)finchar;
  349.         code = oldcode;
  350.         }
  351.  
  352.         while ((cmp_code_int)code >= (cmp_code_int)256) {
  353.         /* Generate output characters in reverse order */
  354.         *--stackp = tab_suffixof(code);
  355.         code = tab_prefixof(code);
  356.         }
  357.         *--stackp =    (char_type)(finchar = tab_suffixof(code));
  358.         
  359.         /* And put them out in forward order */
  360.         {
  361.         REG1 int    i;
  362.         
  363.         if (outpos+(i = (de_stack-stackp)) >= OUTBUFSIZ) {
  364.             do {
  365.             if (i > OUTBUFSIZ-outpos) i = OUTBUFSIZ-outpos;
  366.  
  367.             if (i > 0) {
  368.                 memcpy(outbuf+outpos, stackp, i);
  369.                 outpos += i;
  370.             }
  371.             if (outpos >= OUTBUFSIZ) {
  372.                 if (!test) {
  373.                 write_buf(out, (char*)outbuf, outpos);
  374.                 bytes_out += (ulg)outpos;
  375.                 }
  376.                 outpos = 0;
  377.             }
  378.             stackp+= i;
  379.             } while ((i = (de_stack-stackp)) > 0);
  380.         } else {
  381.             memcpy(outbuf+outpos, stackp, i);
  382.             outpos += i;
  383.         }
  384.         }
  385.  
  386.         if ((code = free_ent) < maxmaxcode) { /* Generate the new entry. */
  387.  
  388.         tab_prefixof(code) = (unsigned short)oldcode;
  389.         tab_suffixof(code) = (char_type)finchar;
  390.         free_ent = code+1;
  391.         } 
  392.         oldcode = incode;    /* Remember previous code.    */
  393.     }
  394.     } while (rsize != 0);
  395.     
  396.     if (!test && outpos > 0) {
  397.     write_buf(out, (char*)outbuf, outpos);
  398.     bytes_out += (ulg)outpos;
  399.     }
  400.     return OK;
  401. }
  402.